Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Bitext segmentation and alignment for specialized document composition

Identifieur interne : 009448 ( Main/Exploration ); précédent : 009447; suivant : 009449

Bitext segmentation and alignment for specialized document composition

Auteurs : Arantza Casillas [Espagne] ; Raquel Martinez [États-Unis]

Source :

RBID : Francis:524-02-13645

Descripteurs français

English descriptors

Abstract

Nous montrons comment, à partir de textes parallèles annotés, il est possible de dériver des ressources linguistiques complémentaires: d'une part des mémoires de traduction spécifiques et d'autre part des DTDs propres aux textes sources et aux textes cibles, qui sont ensuite mis en correspondance. Le présent article discute les méthodes utilisées pour générer ces ressources automatiquement et les appliquer à un environnement auteur bilingue.


Affiliations:


Links toward previous steps (curation, corpus...)


Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="en" level="a">Bitext segmentation and alignment for specialized document composition</title>
<author>
<name sortKey="Casillas, Arantza" sort="Casillas, Arantza" uniqKey="Casillas A" first="Arantza" last="Casillas">Arantza Casillas</name>
<affiliation wicri:level="2">
<inist:fA14 i1="01">
<s1>Departamento de Electricidad y Electrónica, Facultad de Ciencias, UPV-EHU, Apdo. 644</s1>
<s2>48080 Bilbao</s2>
<s3>ESP</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>Espagne</country>
<placeName>
<region nuts="2" type="communauté">Pays basque</region>
</placeName>
</affiliation>
</author>
<author>
<name sortKey="Martinez, Raquel" sort="Martinez, Raquel" uniqKey="Martinez R" first="Raquel" last="Martinez">Raquel Martinez</name>
<affiliation wicri:level="3">
<inist:fA14 i1="02">
<s1>Departamento ESCET, Universidad Rey Juan Carlos, Tulipán s/n</s1>
<s2>28933 Móstoles, Madrid</s2>
<s3>USA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName>
<settlement type="city">Madrid</settlement>
<region nuts="2" type="region">Communauté de Madrid</region>
</placeName>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">524-02-13645</idno>
<date when="2001">2001</date>
<idno type="stanalyst">FRANCIS 524-02-13645 INIST</idno>
<idno type="RBID">Francis:524-02-13645</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000909</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000A33</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000916</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000916</idno>
<idno type="wicri:doubleKey">1248-9433:2001:Casillas A:bitext:segmentation:and</idno>
<idno type="wicri:Area/Main/Merge">009999</idno>
<idno type="wicri:Area/Main/Curation">009448</idno>
<idno type="wicri:Area/Main/Exploration">009448</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="en" level="a">Bitext segmentation and alignment for specialized document composition</title>
<author>
<name sortKey="Casillas, Arantza" sort="Casillas, Arantza" uniqKey="Casillas A" first="Arantza" last="Casillas">Arantza Casillas</name>
<affiliation wicri:level="2">
<inist:fA14 i1="01">
<s1>Departamento de Electricidad y Electrónica, Facultad de Ciencias, UPV-EHU, Apdo. 644</s1>
<s2>48080 Bilbao</s2>
<s3>ESP</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>Espagne</country>
<placeName>
<region nuts="2" type="communauté">Pays basque</region>
</placeName>
</affiliation>
</author>
<author>
<name sortKey="Martinez, Raquel" sort="Martinez, Raquel" uniqKey="Martinez R" first="Raquel" last="Martinez">Raquel Martinez</name>
<affiliation wicri:level="3">
<inist:fA14 i1="02">
<s1>Departamento ESCET, Universidad Rey Juan Carlos, Tulipán s/n</s1>
<s2>28933 Móstoles, Madrid</s2>
<s3>USA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName>
<settlement type="city">Madrid</settlement>
<region nuts="2" type="region">Communauté de Madrid</region>
</placeName>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">TAL. Traitement automatique des langues</title>
<title level="j" type="abbreviated">TAL, Trait. autom. lang.</title>
<idno type="ISSN">1248-9433</idno>
<imprint>
<date when="2001">2001</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">TAL. Traitement automatique des langues</title>
<title level="j" type="abbreviated">TAL, Trait. autom. lang.</title>
<idno type="ISSN">1248-9433</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Alignment</term>
<term>Applied linguistics</term>
<term>Automatic generation</term>
<term>Computational linguistics</term>
<term>Corpus linguistics</term>
<term>Linguistic resources</term>
<term>Natural language processing</term>
<term>Parallel corpus</term>
<term>Segmentation</term>
<term>Translation memories</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Linguistique appliquée</term>
<term>Linguistique informatique</term>
<term>Linguistique de corpus</term>
<term>Corpus parallèle</term>
<term>Génération automatique</term>
<term>Segmentation</term>
<term>Alignement</term>
<term>Traitement automatique des langues naturelles</term>
<term>Ressources linguistiques</term>
<term>Mémoires de traduction</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Nous montrons comment, à partir de textes parallèles annotés, il est possible de dériver des ressources linguistiques complémentaires: d'une part des mémoires de traduction spécifiques et d'autre part des DTDs propres aux textes sources et aux textes cibles, qui sont ensuite mis en correspondance. Le présent article discute les méthodes utilisées pour générer ces ressources automatiquement et les appliquer à un environnement auteur bilingue.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>Espagne</li>
<li>États-Unis</li>
</country>
<region>
<li>Communauté de Madrid</li>
<li>Pays basque</li>
</region>
<settlement>
<li>Madrid</li>
</settlement>
</list>
<tree>
<country name="Espagne">
<region name="Pays basque">
<name sortKey="Casillas, Arantza" sort="Casillas, Arantza" uniqKey="Casillas A" first="Arantza" last="Casillas">Arantza Casillas</name>
</region>
</country>
<country name="États-Unis">
<region name="Communauté de Madrid">
<name sortKey="Martinez, Raquel" sort="Martinez, Raquel" uniqKey="Martinez R" first="Raquel" last="Martinez">Raquel Martinez</name>
</region>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 009448 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 009448 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     Francis:524-02-13645
   |texte=   Bitext segmentation and alignment for specialized document composition
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022